DIG: Mm Serviço de Custos e Estatísticas para o Processamento Distribuído de Consultas

نویسندگان

  • Nicolaas Ruberg
  • Gabriela Ruberg
  • Marta Mattoso
چکیده

Cost parameters and database statistics are the basis of query optimization techniques. However, in distributed and heterogeneous database systems, acquiring and treating information to help the optimization process are often tasks of a global query processor, tailoring these functionalities to a specific system architecture. Moreover, this acquisition process involves a large number of parameters and requires customized methods to retrieve data from specific sources. DIG (Distributed Information Gatherer) is a cost and statistics provider that, through an independent and flexible service, aims to support global query optimization processing in distributed and heterogeneous database systems over autonomous data sources. We developed a DIG prototype and evaluated it with specific wrappers for a query middleware on semi-structured data sources and

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Recomendações para fragmentação horizontal de bases de dados XML

Resumo. A grande quantidade de dados XML disponíveis na Web e dentro das organizações traz consigo um grande desafio no processamento de consultas sobre ambientes distribuídos. Surge então a necessidade da aplicação de técnicas que permitam um processamento de consultas mais eficiente. Neste sentido, técnicas de fragmentação de dados e processamento paralelo de consultas sobre bases de dados di...

متن کامل

Distribuição de Bases de Dados de Proveniência na Nuvem

Resumo. Dados de proveniência no contexto de workflows científicos são peças fundamentais, pois, por meio deles, os experimentos são passíveis de reprodução e validação. O histórico da execução dos workflows é fundamental também para a gerência da execução de novos workflows uma vez que possibilitam às máquinas de workflow realizar predições sobre desempenho ou custo financeiro de nuvens de com...

متن کامل

Junções Adaptativas em Consultas Federadas sobre Linked Data

Motivated by the success of Linked Data and driven by the growing number of data sources into RDF files available on the web, new challenges for query processing are emerging, especially in distributed settings. These environments allow distributed execution of federated queries, which involve joining data provided by multiple sources, which are often unstable. In this sense, the design of new ...

متن کامل

Explorando arquiteturas multi-core para processamento eficiente de consultas em sistemas de gerência de Big Data

Big Data Management Systems usually manage each machine as one node in parallel query processing pipeline. In multi-core architectures, they leave several processor cores aside that could contribute to speed-up query processing. In this context, this paper explores the use of all available processor cores, assessing the query processing performance in several scenarios. In particular, we use th...

متن کامل

Heurísticas para Aprimorar o Método BMW e suas Variantes

In this paper, we propose and evaluate heuristics to improve the performance of BMW and its variants. The proposed changes retain ownership to preserve the order of the first results at the end of processing, offering benefits in an attempt to both further reduces query processing times and the amount of memory required for processing queries. Resumo. Neste artigo são propostas e experimentadas...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2002